AI资讯新闻榜单内容搜索-LLM

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: LLM
Karpathy知识库「LLM Wiki」火爆了,全网围观讨论

Karpathy知识库「LLM Wiki」火爆了,全网围观讨论

Karpathy知识库「LLM Wiki」火爆了,全网围观讨论

Karpathy 表示,大多数人使用 LLM 处理文档的方式,基本都类似于 RAG:你上传一组文件,模型在查询时检索相关片段,然后生成答案。这种方式是有效的,但问题在于每一次提问,模型都在从零重新发现知识。没有积累。

来自主题: AI资讯
7331 点击    2026-04-06 08:51
这个「反人类」AI插件,专门让你体验DeepSeek宕机的感觉|附安装地址

这个「反人类」AI插件,专门让你体验DeepSeek宕机的感觉|附安装地址

这个「反人类」AI插件,专门让你体验DeepSeek宕机的感觉|附安装地址

官方宣传语:你是否隐隐担忧,自己或身边的人正在:参与一场席卷所有人的技能大退化?遭受 LLM 诱发的?一个名为 Sam Lavigne 的大学教授,最近发布并开源了一款名为「Slow LLM」的 AI 工具。

来自主题: AI资讯
7621 点击    2026-03-30 23:55
比现有框架快22倍,浙大开源EasySteer:高性能LLM Steering统一框架

比现有框架快22倍,浙大开源EasySteer:高性能LLM Steering统一框架

比现有框架快22倍,浙大开源EasySteer:高性能LLM Steering统一框架

在此背景下,浙江大学研究团队提出了 EasySteer——一个基于 vLLM 构建的高性能、可扩展 LLM Steering 统一框架。该框架通过与 vLLM 推理引擎的深度集成,相比现有 Steering 框架实现了 10.8-22.3 倍的推理加速,同时提供更细粒度的干预控制,并为八大应用场景提供了预计算 Steering 向量与完整复现示例,方便研究者快速上手和对照复现。

来自主题: AI技术研报
7629 点击    2026-03-22 09:35
后训练中的RL已死?MIT新算法挑战传统后训练思维,谢赛宁转发

后训练中的RL已死?MIT新算法挑战传统后训练思维,谢赛宁转发

后训练中的RL已死?MIT新算法挑战传统后训练思维,谢赛宁转发

在当前的 LLM 开发中,后训练阶段通常被视为赋予模型特定能力的关键环节。传统的观点认为,模型必须通过强化学习(如 PPO、GRPO 或 RLHF)和进化策略(ES)等算法,在反复的迭代和梯度优化过程中调整权重,才能在特定任务上达到理想的性能。

来自主题: AI技术研报
5995 点击    2026-03-16 14:26
Legora、Mercor 都在用,Reducto 能成为独立的 LLM 数据入口吗?

Legora、Mercor 都在用,Reducto 能成为独立的 LLM 数据入口吗?

Legora、Mercor 都在用,Reducto 能成为独立的 LLM 数据入口吗?

Reducto 在去年 6 个月内接连完成分别由 Benchmark 与 a16z 领投的两轮融资,估值翻了 3 倍,达到 6 亿美元。我们认为,Reducto 切中了 AI 应用走向生产环境过程中的“精确数据摄取”瓶颈。

来自主题: AI资讯
9530 点击    2026-03-14 08:41
32B逆袭GPT-5.2:首个端到端GPU编程智能体框架StitchCUDA问世

32B逆袭GPT-5.2:首个端到端GPU编程智能体框架StitchCUDA问世

32B逆袭GPT-5.2:首个端到端GPU编程智能体框架StitchCUDA问世

现有的 LLM 自动化 CUDA 方法大多只能优化单个 Kernel,面对完整的端到端 GPU 程序(如整个 VisionTransformer 推理)往往束手无策。

来自主题: AI技术研报
8064 点击    2026-03-05 14:28
字节杀疯了!豆包 Seed 2.0 专家模式已上线

字节杀疯了!豆包 Seed 2.0 专家模式已上线

字节杀疯了!豆包 Seed 2.0 专家模式已上线

我天!感觉 Seed 1.8 发布还没多久,没想到 Doubao-Seed-2.0 这么快就杀到了…今天发都算是晚讯了。据官方介绍,这次 Seed 2.0 多模态理解能力全面升级,还强化了 LLM 与 Agent 能力,模型在真实长链路任务中可以稳定推进。

来自主题: AI资讯
9971 点击    2026-03-02 23:22